top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

自動音声認識AI「Conformer-2」、英数字や固有名詞の認識など向上

AssemblyAIは、自動音声認識用の最新AIモデルであるConformer-2を発表した。Conformer-1の成功を踏まえて構築されたConformer-2は、単語認識、固有名詞の精度、ノイズ耐性の向上を誇っている。

Conformer-2は、前バージョンよりも大幅に大きい110万時間の英語音声データからなる広範なデータセットでトレーニングされた。このモデルは、ラベル付けに複数の強力な教師モデルを使用するモデルアンサンブルを活用し、トレーニング中に過去に見たことがないデータにさらされた場合の堅牢性とパフォーマンスを向上させる。


ワード誤り率(WER)はConformer-1と一致していたが、Conformer-2はさまざまなユーザー指向のメトリクスで大幅な向上を示した。英数字の転写精度は31.7%向上し、固有名詞エラー率とノイズに対する堅牢性はそれぞれ6.8%と12.0%向上した。

Conformer-2の開発中に重要な焦点となったのは、固有名詞に特化したモデルのパフォーマンスを定量化する固有名詞エラー率(PPNER)メトリクスの作成であり、これは実際のユースケースに不可欠だ。

Conformer-2のトレーニングはAssemblyAI独自のGPUコンピューティングクラスター上で実行され、クラウドベースのインフラと比較して速度の向上が可能になった。この社内ハードウェアの導入により、継続的な実験と研究が促進され、モデルの優れたパフォーマンスに貢献した。

今後に向けて、AssemblyAIはユーザーのフィードバックに基づいてモデルを改良し、現実世界のアプリケーションに関連するより多くのメトリクスを開発し続ける予定だ。同社はまた、将来の進歩に向けて、マルチモダリティーと自己教師あり学習の探求を開始した。

Conformer-2のリリースで、AssemblyAIはそのAPIにspeech_thresholdパラメーターを導入した。ユーザーが処理するオーディオファイルに必要な音声の割合のしきい値を設定できるようにする。Conformer-2はAssemblyAIのAPIを介してアクセスできるデフォルトモデルとなり、既存のAPIユーザーによる変更を必要とせずに優れたパフォーマンスを提供する。
Conformer-2のパワーを体験したい場合、ユーザーはAssemblyAIのPlaygroundを通じてそれを試すことができる。音声ファイルまたはYouTubeリンクをアップロードして、高速で正確な文字起こしを受け取ることができる。

この記事を共有:

最新のニュース
NVIDIAがロボット工学向け物理エンジン「ニュートン」を発表

NVIDIAがロボット工学向け物理エンジン「ニュートン」を発表

26/3/18 0:00

NVIDIA GTC 2026で、最新の物理シミュレーションエンジン「Newton」が発表されました。

NVIDIAがより安全なAIエージェントを実現するNemoClawを発表

NVIDIAがより安全なAIエージェントを実現するNemoClawを発表

26/3/18 0:00

NVIDIAは、高度な自律性で動作するAIエージェント(クロー)の安全性と制御性を向上させるために設計された新しいオープンソーススタック「NemoClaw」を発表しました。

NVIDIA DGX Sparkが自律型AIエージェントの機能を強化

NVIDIA DGX Sparkが自律型AIエージェントの機能を強化

26/3/18 0:00

NVIDIAは、自律型AIエージェントの機能を強化するNVIDIA DGX Sparkを発表し、AI技術の進歩を明らかにしました。

CINC AIエージェント時代のEC戦略

CINC AIエージェント時代のEC戦略

26/3/18 0:00

CINC(東京都港区)は、2026年3月25日にオンラインセミナー『AIが商品を選ぶ時代。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
NVIDIAがロボット工学向け物理エンジン「ニュートン」を発表

NVIDIAがロボット工学向け物理エンジン「ニュートン」を発表

26/3/18 0:00

NVIDIA GTC 2026で、最新の物理シミュレーションエンジン「Newton」が発表されました。

NVIDIAがより安全なAIエージェントを実現するNemoClawを発表

NVIDIAがより安全なAIエージェントを実現するNemoClawを発表

26/3/18 0:00

NVIDIAは、高度な自律性で動作するAIエージェント(クロー)の安全性と制御性を向上させるために設計された新しいオープンソーススタック「NemoClaw」を発表しました。

NVIDIA DGX Sparkが自律型AIエージェントの機能を強化

NVIDIA DGX Sparkが自律型AIエージェントの機能を強化

26/3/18 0:00

NVIDIAは、自律型AIエージェントの機能を強化するNVIDIA DGX Sparkを発表し、AI技術の進歩を明らかにしました。

CINC AIエージェント時代のEC戦略

CINC AIエージェント時代のEC戦略

26/3/18 0:00

CINC(東京都港区)は、2026年3月25日にオンラインセミナー『AIが商品を選ぶ時代。

bottom of page